1
Fundamentos Geométricos de la Optimización Convexa
MATH008Lesson 8
00:00
Imagina navegar un paisaje complejo donde tu objetivo es encontrar el punto más cercano a la seguridad. En el lenguaje de la optimización, esta 'seguridad' es un conjunto $C$, y el acto de encontrar el punto más cercano es una proyección. Aunque la intuición sugiere que siempre existe un único punto 'más cercano', la realidad matemática es más matizada. La base geométrica de la optimización convexa se asienta en formalizar la 'proximidad', avanzando más allá de la intuición euclidiana hacia representaciones funcionales rigurosas como las funciones indicadora y de soporte.

1. Proyecciones y Distancias

La distancia desde un punto $x_0$ hasta un conjunto $C$ se define como el ínfimo de todas las distancias posibles a puntos dentro del conjunto:

$\text{dist}(x_0, C) = \inf\{\|x_0 - x\| \mid x \in C\}$

El optimizador específico que alcanza esta distancia es el operador de proyección:

$P_C(x_0) = \text{argmin}\{\|x - x_0\| \mid x \in C\}$

Para un plano simple definido por $a^T x = b$, la proyección tiene una hermosa solución en forma cerrada: $P_C(x_0) = x_0 + (b - a^T x_0)a/\|a\|_2^2$. Sin embargo, para conjuntos generales, este problema sigue siendo una optimización con restricciones: minimizar $\|x - x_0\|$ sujeto a $f_i(x) \leq 0$ y $Ax = b$.

2. Geometría Funcional

Para tratar las restricciones geométricas como componentes objetivos, empleamos dos potentes 'espejos' funcionales:

  • La Función Indicadora $I_C(x)$: $I_C(x) = \begin{cases} 0 & x \in C \\ +\infty & x \notin C \end{cases}$. Esto reduce la geometría a una penalización numérica.
  • La Función de Soporte $S_C(x)$: $S_C(x) = \sup_{y \in C} x^T y$. Esto caracteriza el conjunto mediante sus hiperplanos de frontera en todas las direcciones.
Teorema: Teorema de Motzkin

Un conjunto no vacío y cerrado $C \in \mathbf{R}^n$ es un conjunto de Chebyshev (que posee una proyección única para cada $x_0$) si y solo si es convexo.

Esquema de Prueba (Unicidad)

Supongamos que $C$ es convexo y la norma es estrictamente convexa. Si hubiera dos puntos distintos más cercanos $u, v \in C$ con $\|u - x_0\| = \|v - x_0\| = d$, entonces su punto medio $w = (u+v)/2$ estaría en $C$ (por convexidad).

Por la convexidad estricta de la norma: $\|w - x_0\| = \|\frac{1}{2}(u - x_0) + \frac{1}{2}(v - x_0)\| < \frac{1}{2}\|u - x_0\| + \frac{1}{2}\|v - x_0\| = d$.

Esto contradice la suposición de que $d$ era la distancia mínima. Por tanto, la proyección debe ser única.

Advertencia 8.4: Dependencia de la Norma

A menudo construimos un hiperplano separador usando: $(P_C(x_0) - x_0)^T (x - (1/2)(x_0 + P_C(x_0))) = 0$. ¡Cuidado! Esta construcción específica es válida solo para la norma euclidiana. Las normas generales requieren tratamientos más sutiles de la ortogonalidad.

🎯 Insight Fundamental
La convexidad es el 'pegamento' que garantiza la estabilidad en la optimización geométrica. Sin ella, incluso la tarea sencilla de 'encontrar el punto más cercano' puede dar lugar a múltiples soluciones contradictorias, provocando inestabilidad algorítmica.